摘要。在医学图像分析的最新进展中,综合神经网络(CNN)和视觉变压器(VIT)设定了重要的基准。虽然前者通过其卷积行动占领了当地的效果,但后者通过利用自我发场机制来实现非凡的全球环境理解。然而,两种体系结构在有效地对医学图像中的长期依赖性建模时都表现出局限性,这是精确分割的关键方面。受到Mamba体系结构的启发,该建筑的熟练程度熟练地处理长序列和以提高计算效率作为状态空间模型(SSM)的全球上下文信息,我们提出了Mamba-Unet,这是一种新颖的体系结构,这是一种具有MAMBA能力的医学图像序列中的U-NET。mamba-unet采用了基于跳过连接的纯净视觉曼巴(VMAMBA)基于编码器的结构,以在网络的不同尺度上保留空间信息。此设计促进了一个全面的特征学习过程,捕获了复杂的细节和医学图像中更广泛的疾病环境。我们在VMAMBA块中引入了一种新颖的集成机制,以确保编码器和解码器路径之间的无缝连通性和信息流,从而增强分割性能。我们对公开可用的ACDC MRI心脏分割数据集进行了实验,并进行了Synapse CT CT腹部分割数据集。结果表明,在同一超参数设置下,Mamba-Unet在医疗图像分割中的表现优于几种类型的UNET 1。源代码和基线信息可在https://github.com/ziyangwang007/mamba- unet上获得。
主要关键词
![arxiv:2402.05079v2 [eess.iv] 2024年3月30日PDF文件第1页](/bimg/a/a1f7dae9bf40b1bae3a7f406943f3e8479f41461.webp)
![arxiv:2402.05079v2 [eess.iv] 2024年3月30日PDF文件第2页](/bimg/7/7366fcff17c248674bb408b3d9e807d8b0d39da8.webp)
![arxiv:2402.05079v2 [eess.iv] 2024年3月30日PDF文件第3页](/bimg/4/4e9a85152d28ddc632eee4aad6db243a6ae5c61f.webp)
![arxiv:2402.05079v2 [eess.iv] 2024年3月30日PDF文件第4页](/bimg/7/7f3513bce2a80cc3aeb328d4e70134e0c936fb56.webp)
![arxiv:2402.05079v2 [eess.iv] 2024年3月30日PDF文件第5页](/bimg/e/e2df4034a14578c54f75e7e2ebbb108384fa278e.webp)

![arxiv:2402.05079v2 [eess.iv] 2024年3月30日](/simg/2/2cc87b240d96e4b59e1f32ad379715883beaa530.webp)